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(54) PROCEDE DE COMPRESSION D'IMAGES ET DISPOSITIF POUR LA MISE EN OEUVRE DE CE PROCEDE. 



(57) L'invention est relative a un procede de compression 
cfimages, notammentdu type MPEG2 dan I quelle m 
ges sort codees suivant des groupes (GOP) dont chacun 
comprend N image s, ; cum image I codee en intra, des 
images P predites en fonction de I'image intra I ou d'une 
image P precedents, chaque image F ii ri--TTL^ ?! ui- 
vie par n images B edites idirectio H le merit, n pouvant 
etre nul. Le nombre M = n + 1 represents la structure du 
groupe. 

On determine a raide d'un codage d'essai (70) au moins 
un parametre caracterisant les images sources devant etre 
codees suivant u i gn j e et ,f d e es nombres 

N et M de ce is i f ^ - ;tre(s).Au ours du codage d : essal, 
on confere des valeurs determinees a N, M et au pas de 
quantification Q. 
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PROCEDE DE COMPRESSION D' IMAGES ET DISPOSITIF POTJR LA MISE EN 
OEUVRE DE CE PROCEDE 



L 1 invention est relative a un procede de compression 
d 1 images dans lequel les images sont codies suivant des groupes 
de longueurs variables. 

Elle concerne plus particulierement un procedS de type 
5 MPEG, notamment de type MPEG2 . Bien que 1' invention ne soit pas 
limitee a cette norme, dans la suite de la description, on se 
referera principalement a celle-ci. 

On rappelle ci-apres le principe d'une telle com- 
pression. 

10 Dans la norme MPEG2 video, on obtient une compression 

des signaux numeriques video en exploit ant la redondance spa- 
tiale et la redondance temporelle des images codees. 

La redondance spatiale est evaluee principalement 
grace a la succession de trois operations : une operation com- 

15 munement appelee transformee cosinus discrete et notee DCT 
{"Discrete Cosine Transform"} , une operation de quantification 
des coefficients issus de la DCT et une operation de codage a 
longueur variable pour decrire les coefficients quantifies issus 
de la DCT. 

20 La redondance temporelle est analysee par une opera- 

tion de compensation de -nouvement qui consiste, par translation 
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de chaque bloc de 1' image courante, a rechercher le bloc le plus 
ressemblant situe dans une image de reference. L' analyse de la 
redondance temporelle conduit a determiner un champ de vecteurs 
de translation, communement appeles vecteurs de mouvement, ainsi 
5 qu'une erreur de prediction qui est la difference entre le 
signal de 1 1 image courante et le signal de 1 [ image predite par 
compensation de mouvement. L 1 erreur de prediction est alors 
analysee selon le principe de la redondance spatiale. 

Le codage MPEG2 est de type predict if. II s'ensuit que 

10 le decodage qui lui est associe doit etre regulierement reini- 
tialise afin de proteger le signal contre toute erreur de trans- 
mission ou toute rupture de signal due au basculement du 
decodeur d'un programme sur un autre. 

A cette fin, la norme MPEG2 prevoit que , periodi - 

15 quement, les images doivent etre codees en mode spatial, c'est- 
a-dire selon un mode exploitant seulement la redondance 
spatiale. Les images codees en mode spatial sont appelees images 
INTRA ou images I. 

Les images codees en exploitant la redondance tempo- 

20 relle sont de deux types : d'une part, les images construites 
par reference a une image tempo re llement anterieure a partir 
d'une prediction avant et, d' autre part, les images construites 
par reference a deux images temporellement anterieure et pos- 
terieure a partir d'une prediction avant et d'une prediction 

2 5 arriere. 

Les images codees construites a partir d'une predic- 
tion avant sont appelees images predites ou images P et les 
images codees construites a partir d'une prediction avant et 
d'une prediction arriere sont appelees images bidirectionnelles 

3 0 ou images B. 

Une image I est decodee sans faire reference a" 
d'autres images qu'a elle-meme. Une image P est decodee en 
faisant reference a 1' image P ou I qui la precede, Une image B 
est decodee en faisant appel a 1' image I ou P qui la precede et 
3 5 a 1' image I ou P qui la suit. 
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La periodica. te des images I definit un groupe d' images 
communement note GOP ("Group Of Pictures") . 

A I'interieur d'un meme GOP, la quantite de donnees 
contenues dans une image I est generalement superieure a la 
5 quantite de donnees contenues dans une image P et la quantite de 
donnees contenues dans une image P est generalement superieure a 
la quantite de donnees contenues dans une image B. 

En 50 Hertz, le GOP se prisente comme une image I sui- 
vie d'une sequence d' images B et P qui pr^sente, la plupart du 
10 temps, la sequence suivante 

I, B, B, P, B, B, P, B, B, P, B, B. 

Cependant, la norme n' oblige pas a prevoir, comme 
c'est le cas en general, N = 12 images dans un GOP, ni a prevoir 
que les distances M entre deux images P soient tou jours egales a 
15 3. De fa?on plus precise, la distance M est le nombre n d' images 
B precedant ou suivant une image P, augment^ d'une unite, soit 
M = n + l. 

Le nombre N represente la taille ou longueur du GOP, 
tandis que le nombre M represente sa structure. 

20 L 1 invention resulte de la constatation que l'on peut 

agir sur les parametres M et N pour ameliorer le taux de 
compression et/ou ameliorer la qualite du codage, 

Le procede de codage selon 1' invention est caracterise 
en ce qu'on determine au moins un parametre caracterisant les 
25 images sources devant etre codees suivant un groupe et en ce 
qu'on fait dependre la longueur et la structure du groupe de 
ce (s) parametre (s) . 

Dans un mode de realisation, le (les) parametre (s) 
caracterisant les images sources est determine a l'aide d'un 
3 0 codage d'essai au cours duquel on confere des valeurs deter- 
mines a N, M et au pas Q de quantification. 

Le codage d'essai est par exemple realise en boucle 

ouverte. 

Dans une realisation particulierement simple, on 
3 5 determine separement un parametre {Pcost) caracterisant les 
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4 

images P obtenues lors du codage d'essai et un parametre (Bcost) 
caracterisant les images B obtenues lors du codage d'essai, ces 
parametres caracterisant les images P et B etant, de preference, 
les couts moyens de codage des images P et B. Le cout de codage 
5 d'une image est le nombre de bits [en-tetes compris) necessaire 
pour le codage. 

Dans ce cas, on peut faire dependre le nombre N du 
parametre caracterisant les images P et le nombre M du parametre 
caracterisant les images B. 

10 Lors d'essais effectues dans le cadre de 1' invention, 

sur des sequences d' images de natures di verses, on a constate 
gu'il existait, pour chague nature de sequence, un nombre N 
optimal fournissant un minimum de cout de codage {ou debit) pour 
les images P et un nombre M optimal fournissant un minimum de 

15 cout de codage (ou debit) pour les images B, ces coGts etant 
obtenus lors du codage d'essai. Ces sequences se distinguent les 
unes des autres par des mouvements d'amplitudes variables, des 
objets differents, des definitions spatiales differentes et des 
contenus differents. 

20 On a en outre constate qu'il existe une relation pra- 

tiquement lineaire entre le nombre N optimal et le debit des 
images P. De m§me, il existe une relation pratiquement lineaire 
entre le nombre M et le debit des images B. Ainsi, connaissant 
les debits des images P et B, il est aise de calculer les 

25 nombres N et M fournissant les meilleurs resultats. 

Dans un exemple correspondant a la norme MPEG2, 50 Hz, 
le codage d'essai s'effectue avec N = 12, M = 3 et Q = 15, la 
relation entre N et le debit des images P est approximativement 
la suivante : 

(1) N = INT pB9C00-Pco 5 t 1 + j_ avec 12 < N < 30, 

L ioooo J 

et la relation entre M et le debit, ou cout, Bcost des 
images B est la suivante : 

(2) M = INT p^0Q-Bcost 1 + y avec 1 < M < 7 . 

L 20000 J 
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II est £galement possible de limiter M a 5. 

Dans ces formules, INT signifie la partie entiere. 

La limitation de N entre 12 et 30 et la limitation de 
M a une valeur maxima le de 7 permet une realisation simple des 
5 codeurs et de limiter le temps de changement de programme. Dans 
le meme but, on peut aussi imposer d'autres limitations ou 
contraintes, notamnent que M soit constant dans le GOP et/ou 
qu'il soit un sous -multiple de N. 

Dans une realisation, si les valeurs de N et de M 
10 prises individuellement et ensemble ne sont pas compatibles avec 
les contraintes, on choisira des valeurs de M et de N les plus 
proches des valeurs calculees et qui sat is font a la compati- 
bility imposee. Dans ce cas, on privilegiera la valeur de M, 
c'est-a-dire que si un choix doit etre effectue entre plusieurs 
15 couples M, N, on choisira le couple pour lequel la valeur M est 
la plus proche de celle qui resulte du calcul. 

La formule (2) ci-dessus ne s' applique que si Bcost ne 
depasse pas 179000. Dans le cas contraire, c'est-a-dire si 
Bcost > 179000, 1' experience a montre qu'il fallait, dans cet 
20 exemple, que M soit choisi de la facon suivante : 

fp cos t 1 
(3) M = 5.IN^ 1 , avec 1 < M < 7. 

Lb cost J 

Si le coGt d'une image B est superieur au cout d'une 
image P, il est preferable que le GOP ne contienne pas d' image 
B, c'est-a-dire M = 1. En effet, les images P pr£sentant une 

2 5 meilleure quality de prediction que les images B et etant, par 

hypothese, de cout inferieur, la presence de telles images B 
constituerait un inconvenient dans ce cas. 

Les couts, en bits, de chaque image P et de chaque 
image B sont determines, par exemple, au fur et a mesure de 

3 0 1' apparition de ces images. Dans une realisation, les valeurs de 

M et N sont selectionnees en effectuant une moyenne sur toutes 
les images P et B du codage d'essai, le codage proprement dit 
n' etant effectue" qu'apres le codage d'essai de N images sources, 
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N etant determine par le cout de codage des images P. Dans ce 
cas, le param£tre M peut rester constant dans le GOP. 

Dans une autre realisation, qui permet une adaptation 
plus rapide aux variations de contenus des scenes ainsi qu'une 
5 reduction du retard entre l'arrivee des images sources et le 
codage proprement dit (et qui permet done une memoire tampon de 
capacite plus reduite) , on fait demarrer le codage proprement 
dit des que le codage d'essai fournit des donnees permettant ce 
demarrage. Ainsi, la premiere image B du codage d'essai foumit 

10 un nombre M permettant de demarrer le codage et le nombre N est 
fourni par la premiere image P du codage d'essai. 11 est igale- 
ment possible de ne faire dgbuter le codage qu'apres le codage 
d'essai de la premiere image P ; dans ce cas, le codage demarre 
lorsqu'une valeur de N et une valeur de H sont connues. 

15 Avec ce type de codage "a la volee", le nombre M, 

e'est-a-dire la structure, peut varier a l'interieur d'un GOP, 
ce qui permet une adaptation rapide aux variations de contenu de 
la scene. 

Dans ce codage effectuS au fur et a mesure, le GOP est 
20 interrompu quand le nombre d' images deja codees dans le GOP 
courant est au moins egal au nombre N mesure" (par Pcost dans 
l'exemple ci-dessus), ou lors d'un changement de scdne. 

Pour eviter des variations importantes des parametres 
entre groupes qui se succedent, il peut s'averer utile de 
2 5 s'ecarter des valeurs calculees. Par exemple, si le calcul rnon- 
tre que, pour une grande partie de la longueur du GOP, par 
exemple au moins 80%, il faudrait M = 1, alors que, pour le 
rests du GOP, le calcul montre que M doit etre superieur a l, on 
adopte, malgre tout, la valeur 1 pour M, meme si le calcul 
30 montre qu'il faut une valeur differente. 

De facon similaire, si pour le GOP precedent, M = l et 
si, pour le GOP courant, le calcul montre qu'il faudrait une 
valeur H = l pour une partie importante du GOP courant, par 
exemple au moins 60%, on adopte aussi la valeur l pour K, meme 
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si le resultat du calcul, tel qu'il resulte de la formule (2) 
ci-dessus, implique une valeur differente. 

On sait que lorsqu'un changement de scene intervient, 
c'est-a-dire lorsqu'il apparait une discontinuity dans la suite 
5 des images video, il est necessaire d' adapter les groupes 
d' images GOP de part et d' autre de la discontinuity de facon 
telle que le nouveau groupe, qui demarre avec une image I, cor- 
responde a la nouvelle scene. 

Dans un mode de realisation, si le changement de scene 

10 intervient dans un groupe, la scene nouvelle const itue 1' image I 
d'un groupe nouveau, le groupe altere etant raccourci pour s'ar- 
reter avant cette scene nouvelle si le changement de scSne 
intervient, dans le groupe altere, a une distance du debut au 
moins egale au nombre minimum admissible pour N. Le debut du 

15 groupe alterS est utilise 1 pour allonger le groupe qui le precede 
lorsque la somme du nombre d 1 images precedant le changement de 
scene dans le groupe altere et du nombre d 1 images du groupe qui 
le precede ne depasse pas le maximum admissible pour N. Dans ce 
groupe precedent ainsi modifie' (raccourci ou allongS) , il peut 

2 0 etre necessaire de modifier le nombre M precedemment calcule 
pour ce GOP. 

Dans une variante, qui s' utilise de preference dans le 
cas ou la longueur du groupe altere est inferieure au nombre 
admissible pour N, quand un changement de scene intervient dans 

2 5 un groupe, la scene nouvelle constitue 1 1 image I d'un groupe 
nouveau, ce groupe nouveau ayant une longueur egale a la moyenne 
de la longueur du groupe avant alteration et de la longueur du 
groupe qui le precede. Avec cette variante, il peut etre neces- 
saire de modifier le nombre M precedemment calcule pour les GOP. 

30 Quand deux modifications sont possibles, par exemple 

quand la longueur du groupe altere est inferieure au minimum 
admissible pour N r on peut effectuer un choix entre ces deux 
modifications en effectuant, pour chaque modification, un calcul 
de la distance du couple (M,N) obtenu ou couple M,N avant modi- 
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fication et en selectionnant le couple pour lequel la distance 
est la plus faible . 

Pour determiner les parametres N et M, on peut faire 
appel a la mesure d'autres parametres que la mesure des debits. 
5 Par exemple, on peut faire appel, pour determiner N, a l'energie 
des images Intra I. On peut egalement determiner 1' amplitude des 
mouvements ou l'erreur de compensation de mouvement dite DFD 
(Displaced Frame Difference) pour la determination de H et N, 

D'autres caracteristiques et avantages de 1' invention 
10 apparaitront avec la description de certains de ses modes de 
realisation, celle-ci etant effectuee en se referant aux dessins 
ci-annexes, sur lesquels : 

la figure 1 illustre un macrobloc au standard 4.2.0, 

la figure 2 est un schema illustrant la transformation 

15 DCT, 

la figure 3 montre un groupe d' images GOP selon la 
norme MPEG ou analogue, 

les figures 4 a 7 sont des diagrammes illustrant le 
precede conforme a 1 ' invention, et 

2 0 la figure 8 est un schema d'un montage pour la mise en 

oeuvre du procede selon 1' invention. 

On se re fere tout d'abord aux figures 1 a 3 qui visent 
a rappeler certains principes utilises dans le codage MPEG2. 

Dans la norme MPEG2 , on peut partir d'une image com- 
25 portant, en mcde progressif, 576 lignes de 720 points chacune. 
En mode entrelace, cette image est composee de deux trames dont 
chacune comprend 288 lignes, egalement de 720 points chacune. 

Chaque image est decomposee en macroblocs dont chacun 
est forme par un carre" de 16X16 points de luminance. Chaque 

3 0 macrobloc est ainsi forme de quatre blocs carres de 8X8 points 

de luminance. A chacun de ces quatre blocs de luminance, on 
associe [dans le format 4.2.0) deux blocs de chrominance dont 
chacun presente 8X8 points, l'un des blocs representant le 
signal Cr de difference de couleur ou chrominance rouge et 
35 1' autre bloc representant ie signal Cb de difference de couleur 
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ou chrominance bleue. Dana le format 4.2.2, a chaque macrobloc 
de luminance, on associe quatre blocs de chrominance 8X8, deux 
blocs pour la chrominance bleue et deux blocs pour la chro- 
minance rouge. II existe aussi un format 4.4.4 pour lequel 
5 chacune des composantes de luminance et de chrominances comporte 
chacune quatre blocs 8x8. 

On a represents sur la figure 1 quatre blocs de lumi- 
nance 8x8, de reference 10 dans 1* ensemble et des blocs 12 et 14 
de chrominance 8x8 pour les chrominances respect ivement bleue et 

10 rouge, 1' ensemble illustrant un macrobloc au standard 4.2.0. 

Chaque bloc est code en utilisant une transformation 
notee DCT qui est une transformation cosinus discrete qui permet 
de transformer un bloc de luminance (par exemple) en un bloc de 
coefficients reprgsentant des frequences spatiales. Comme on 

15 peut le voir sur la figure 2, un bloc source 16 est transform^ 
en un bloc 18 de 8X8 coefficients. Le coin suplrieur gauche 20 
du bloc 18 correspond aux frequences spatiales nulles (valeur 
moyenne du bloc) et, a partir de cette origine 20, les fre- 
quences horizontales augmentent vers la droite, conme represents 

20 par la fleche 22, tandis que les frequences spatiales verticales 
augmentent en partant du haut vers le bas, comme reprdsente par 
la fleche 24. 

Pour chaque macrobloc, il faut choisir le type de 
codage : soit "intra", soit "inter". Un codage intra consiste a 
25 appliquer la transformation DCT sur un bloc source de 1' image, 
tandis qu'un codage inter consiste a appliquer la transformation 
DCT sur un bloc represent ant la difference entre un bloc source 
et un bloc prgdit, ou bloc de prediction, d'une image pre'cSdente 
ou suivante. 

3 0 Le choix depend en partie du type d 1 images auquel 

appartient le macrobloc. Ces images sont de trois types : le 
premier type est le type dit I, ou intra, pour lequel le codage 
est intra pour tous les macroblocs . 

Le second type est de type P ou de prediction ; dans 

3 5 ce type d' images, le codage de chaque macrobloc peut etre soit 
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intra soit inter. Dans le cas d'un codage inter sur une image de 
type P, la transformation DCT est appliquee sur la difference 
entre le macrobloc courant de cette image P et un macrobloc de 
prediction issu de 1 1 image I ou P pr£c£dente . 
5 Le troisiSme type d' images est appele B ou bidi- 

rectionnel. Chaque macrobloc d'un tel type d' image est soit code 
en intra, soit code en inter. Le codage en inter eonsiste ega- 
lement a appliguer la transformation sur la difference entre le 
macrobloc courant de cette image B et un macrobloc de prSdic- 

10 tion. Ce macrobloc de prediction peut etre iBsu soit de l 1 image 
prScedente soit de 1' image suivante ou des deux a la fois {pre- 
diction bidirectionnelle) , les images de prediction dites pr£c6- 
dente ou suivante ne pouvant etre que de type I ou P. 

On a represent^ sur la figure 3 un ensemble d' images 

15 formant un groupe appele GOP { "Group Of Pictures") qui comprend 
douze images, a savoir une image I suivie de onze images B et P 
selon la succession suivante : B, B, P, B, B, P, B, B, P, B, B. 

Un GOP est caractfirise par une longueur, c'est-a-dire 
un nombre d' images N qui, dans un exemple, ne peut Stre compris 

2 0 que entre 12 et 30, et par un parametre de structure M repre- 
sent ant la distance entre deux images P, c'est-a-dire le nombre 
d' images B entre deux images P successives, augmente d'une 
unitS. Dans cet exemple, ce parametre M est egal a 3. Egalement 
k titre d' exemple, ce nombre M peut etre compris entre 1 (pas 

2 5 d' image B) et 7. En outre, on impose que ce nombre M soit un 

sous multiple du nombre W pour simplifier le codeur. 

Jusqu'a present, les images sont codles en gardant N 
et M constants dans le codeur. 

L 1 invention resulte de la constatation qu'il existe 

3 0 des valeurs optima les de M et de N qui different selon des 

sequences d' images codees. En effet, selon que les sequences 
d 1 images presentent une definition plus ou moins importante et 
un mouvement plus ou moins important, les valeurs optimales de M 
et de N peuvent differer de facon importante. Par valeur opti- 
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male, on entend celles qui, pour une m&ne qualite, exigent un 
nombre minimum de bits. 

Au surplus, les etudes experiments les effectuees dans 
le cadre de 1' invention ont montre que la taille optimale Nopt 
5 du GOP pour une sequence determines d' images correspond a la 
valeur minimale Pcost, sur cette sequence, du nombre de bits 
qu'il faut utiliser pour coder (en-tetes compris) les images P. 
Cette propri£te est illustr^e par le diagramme de la figure 4 
sur lequel on a porte, en abscisses, le nombre N et, en ordon- 

10 nees, la valeur Pcost pour une sequence notee i. Cette valeur 
Pcost est le nombre de bits a utiliser pour coder une image P en 
valeur moyenne sur la sequence i. On voit, ainsi, que la valeur 
Pcost (i) est representee par une courbe 32 presentant un minimum 
34 pour lequel la valeur de N est optimale (Nopt) . 

15 De facon analogue, on a constate que la valeur opti- 

male du nombre M correspond au minimum Bcost(i) du nombre de 
bits a utiliser en valeur moyenne pour coder des images B sur 
une sequence determinee, not§e i. Ainsi, sur le diagramme de la 
figure 5, le nombre M a €t€ represents en abscisses et, en 

2 0 ordonnees, on a porte le nombre Bcost(i). On voit, sur ce dia- 

gramme, que la courbe 36 presente un minimum 38 correspondent a 
la valeur optimale de M (Mopt) . 

Des mesures ont et6 effectuees, notamment sur des 
sequences test classiques en codage MPEG et notees "Horse", 
25 "Flower garden" et "Hobcal" . La sequence "Horse" correspond a 
des mouvements rapides et avec une bonne definition, la sequence 
"Flower garden" correspond egalement a une bonne definition et 
des mouvements moyens, tandis que la sequence "Mobcal" corres- 
pond a peu de mouvement et a une definition elevee. D'autres 

3 0 sequences ont egalement ete" testees, telles qu'une sequence de 

kayak avec des mouvements rapides et peu de definition, une 
sequence de basket et une sequence avec des mouvements moyens, 
homogenes et des images de bonne definition. 

On a aussi constate que, si le groupe est soumis a un 
35 codage d'essai avec des valeurs determinees M, de N, et du pas Q 
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de quantification, ces valeurs ne correspondent pas obligatoire- 
ment aux valeurs optimales pour la sequence i consid6ree, le 
cout moyen de codage Pcost des images P et le coGt moyen de 
codage Bcost des images B reprSsentent respect iveraent N et M. En 
5 outre, comme le montre la figure 6, il existe une relation 
simple entre les nombres Nopt pour chaque sequence i et le cout 
de codage Pcost a M, N et Q determines. Cette relation est lin£- 
aire ou sensiblement lineaire, etant representee par une droite 
40 (figure 6) sur laquelle des points differents 42, 44, etc. 
10 representent des s6quences differentes. 

La figure 7 est un diagramme sur lequel les nombres 
Mopt sont portes en abscisses et le cout de codage Bcost (a M, N 
et Q determines) est porte en ordonnees ; chaque point 52, 54, 
56, etc. correspond a une sequence donnee. On voit que ces 
15 points se trouvent sur une droite 60. Il y a done une relation 
lineaire entre Mopt et le cout du codage d'essai. 

Lorsque les valeurs de M, N et Q, utilisees au cours 
du codage d'essai, sont les suivantes : 

M = 12, 
2C N = 3, et 

Q - 15, 

les valeurs de M et N satisfont aux relations sui- 
vantes : 

„, „ _„J383000 - Pcost] 

(1) N = -NT — + 1, avec 12 < N < 30. 

L 10000 J 

f _ t mm Tk J"l7 3000 - B cos tl 

25 [2) M = INT] + 1 , avec 1 < M < 7. 

I 20000 j 

Bien que pour la formule (2) ci-dessus, on ait indique 
que H devait etre compris entre 1 et 7, on voit sur le diagramme 
de la figure 7 qu'en fait, M peut etre limite a 5. 

Un montage destine a la mise en oeuvre de 1 ' invention 
30 est represents sur la figure 8. II comprend un premier codeur 
HPEG2 70 destine a effectuer le codage d'essai ou "premiere 
passe" de codage. Ce codeur d'essai est regie avec les para- 
metres fixes indiques ci-dessus, a savoir, dans 1'exemple : 
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M - 12, N = 3 et Q = 15. Ce codeur d'essai fonctionne, dans 
l'exemple, en boucle ouverte, c'est-a-dire sans regulation. 

Le codeur 70 foumit les valeurs Boost et Pcost qui 
sont appliquees a un convertisseur 72 qui realise les conver- 
5 sions de Pcost en Nopt et Boost en Mopt, comme represents sur 
les figures 6 et 7 et conf ormement aux relations (1) et (2) ci- 
dessus . 

Ces valeurs N et M sont ca leu lees pour un groupe 
d 1 images, comme decrit ci-dessus, et sont ensuite appliquees a 
10 une entree de commande 76 d'un codeur MPEG2 74. 

Les donnees a l 1 entree du codeur 74 sont les raemes que 
celles a 1' entree du codeur d'essai 70. On prevoit done une 
memoir e tampon 78 pour tenir compte du temps de traitement dans 
le codeur d'essai 70 et dans le convertisseur 72, cette memoire 
15 78 retenant les donnSes pendant le traitement. 

Dans le convertisseur 72, il est egalement verifie que 
les couples N,M resultant des formules (1) et (2) sont compa- 
tibles avec les contraintes imposees dans le mode de reali- 
sation, en particulier que M est un sous multiple de N. Si les 
2 0 valeurs resultant du calcul ne sont pas compatibles, on adopte 
des valeurs de N et de M les plus proches de celles qui ont 6te 
calculees, en privilegiant , cependant, la valeur M. 

Le convertisseur 72 tient egalement compte de condi- 
tions supplementaires . 

2 5 En premier lieu, il effectue une comparaison entre 

Bcost et Pcost et, si Bcost est sup£rieur a Pcost , on affecte la 
valeur 1 au nombre M, le GOP ne contenant pas d' image B. En 
effet, dans cette hypothese, les images B entrainent un cout de 
codage superieur aux images P, il est preferable de ne conserver 

3 0 que des images P qui presentent une qualite de prediction supe- 

rieure . 

En second lieu, le convertisseur compare Bcost a la 
valeur 179000 et si Bcost depasse 179000, la relation {2} ci- 
dessus est remplacee par la relation heuristique ci-dessous : 
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r p cos t i 

(3) M - 5. INlH 1 , avec 1 < M < 7. 

LB cost j 

Le convertisseur 72 permet aussi de tenir compte de 
deux cas particuliers pour lesquels il est necessaire de s'ecar- 
ter de la relation (2) pour obtenir une homogeneite de qualite 
5 des images. 

Le premier cas est le suivant : le codage d'essai 
montre que M doit presenter une valeur au moins Sgale a 2, raais, 
par ailleurs, ce codage d'essai montre aussi que les valeurs 
intermediaires obtenues par M sont egales a 1 sur une grande 
10 partie du groupe, par exemple au moins 80%. Dans ce cas, le 
convertisseur 72 impose que M soit egal a 1. 

Le second cas est similaire au premier : le codage 
d'essai montre que M devrait etre au moins egal a 2, mais les 
valeurs intermediaires obtenues pour H sont egales a 1 pour au 
15 moins une partie de la longueur du groupe, par exemple 60% 
(cette limite est infirieure a la limite prevue dans le premier 
cas), et le groupe precedent est tel que M = 1. Dans ce cas, on 
confere aussi la valeur 1 au nombre M. 

Ces deux cas particuliers pour lesquels on pose la 
20 valeur 1 a M resultent d'essais effectues dans le cadre de 1' in- 
vention qui ont montre que ces conditions permettent, pour un 
meme type de sequence, une bonne uniformite de qualite sur des 
groupes successifs. 

Enfin, le convertisseur 72 tient compte des chan- 

2 5 gements de scene ou "cuts" qui sont habitue llement detectes dans 

les codeurs. Quand un tel changement de scene intervient, on 
fait demarrer le GOP avec la nouvelle scene, c'est-a-dire que, 
lorsgue la nouvelle scene apparait, on lui attribue une image 
intra I. 

3 0 En outre, avec le precede de 1' invention, quand un 

changexient de scene est cetecte, on configure le GOP precedent 
et le GOP courant en fonction des considerations suivantes : 
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Si le changement de scene apparait dans un GOP apres 
la douzieme image, le nouveau GOP demarre alors avec le change- 
ment de scene, le GOP precedent etant ainsi limits ou raccourci. 

Si, par centre, le changement de scene apparait avant 
5 la douzieme image, il n'est alors plus possible de limiter le 
GOP precedent de facon a ce qu'il se termine juste avant le 
changement de scene, car, dans ce cas, son nombre d' images 
serait inf£rieur au nombre minimum impose. On modifie alors le 
GOP precedent et le GOP courant de la facon suivante en dis- 

10 tinguant deux cas. 

Dans le premier cas, le changement de scene apparait a 
un moment tel que la somme du nombre d 1 images du GOP precedent 
et du nombre d 1 images du GOP courant, juste avant le changement 
de scene, soit au plus egal £ 30. Dans ce cas, le GOP precedent 

15 est allonge. 

Dans le second cas, la somme du nombre d' images du GOP 
precedent et du nombre d" images du GOP courant juste avant le 
changement de scene est supSrieur a 30. Le GOP precedent et le 
GOP courant sont alors rearranges en calculant une moyenne cor- 

20 respondant a ces deux GOP. 

Par exemple, si le GOP precedent est tel que N = 25 et 
M = 2 et si le changement de scene intervient apres la huitieme 
image du GOP courant pour lequel le calcul indique N = 20 et 
M = 3, le GOP precedent allonge du GOP courant ecourte comporte 

25 33 images. Cette valeur depassant le maximum admissible [30}, on 
cherche une "moyenne" correspondant a deux GOP dont le nombre 
total d' images est 33, chacun des GOP devant respecter les 
contraintes imposees. Dans ce cas, on voit qu'on peut choisir 
N=18etM=2 pour le GOP precedent et N = 15 et M = 3 pour le 

3 0 GOP juste avant le changement de scene. Les longueurs 18 et 15 
sont proches de la moyenne (16,5) de la longueur du groupe pre- 
cedent (25) et de la longueur (8) du groupe courant alt ere. 

Des tests ont ete realises sur douze sequences diffe- 
rentes avec des changements de scene, des eclairs lumineux 

3 5 (flashes) et des durees relativement importantes, et on a com- 
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pare les resultats obtenus avec un procede de codage classique, 
correspondant a des valeurs fixes de H et de N aux resultats 
obtenus avec le procede selon 1' invention qui adapte les valeurs 
de M et de N a des sequences. Ces tests ont ete realises avec 
5 plusieurs debits. On a constate une augmentation de qualite, 
mesuree par le parametre PSNR {Peak Signal to Noise Ratio) , de 
0,2 dB a 1,14 dB. Cette augmentation de PSNR correspond a une 
economie en bits comprise entre 2 et 22% environ. 

Le procede selon 1' invent ion peut St re utilise pour 
10 tout type de procede de compression d 1 images video dans lequel 
on prevoit des images I, P et B. II s' applique tant a l'enre- 
gistrement, en temps reel ou en temps differe, qu'a la trans- 
mission. 

Le procede n'est pas limite au cas oil la taille du GOP 
15 est determinee avant codage. II s' applique aussi quand les para- 
metres M et N sont caleules pour chaque image, le codage 
proprement dit s'effectuant a la volee. Dans ce cas, le nornbre M 
peut varier dans un GOP, un nouveau GOP commencant par exemple 
quand le nornbre d' images codees dans le GOP courant est au moins 
20 egal au nornbre N calcule. Le nornbre M peut varier en fonction de 
la complexite des images a l'interieur d'un GOP. 

Dans ce cas, il n'est pas necessaire de memoriser 
1 1 ensemble du GOP dans la memoire tampon 78 (dont la capacite 
peut etre reduite) , les contraintes sur les valeurs de M et N 
2 5 sont reduites, etant seuleraent imposees par la norme MPEG2 ; les 
contraintes imposees lors des changements de scenes sont aussi 
moins severes. 
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REVEHDICATIOHS 

1. Procede de compression d' images dans lequel les 
images sont codees suivant des groupes (GOP) dont chacun com- 
prend un nombre N d' images, N representant la longueur du 
groupe, lequel comport e une image I codee en intra, des images P 

5 predites en fonction de 1' image intra I ou d'une image P pre- 
cedente, chaque image P etant prec£dee et suivie par n images B 
prSdites bidirectionnellement, n pouvant etre nul, le nombre M, 
qui est egal au nombre n augmente d'une unite, representant la 
structure du groupe, caracterise en ce qu'on determine au moins 
10 un parametre caracterisant les images sources devant etre codees 
suivant un groupe et en ce qu'on fait dependre la longueur N et 
la structure M du groupe de ce(s) parametre (s) . 

2. Procede selon la revendication 1, caracterise en ce 
que le (les) parametre (s) caracterisant les images sources est 

15 determine a I'aide d'un codage d'essai au cours duquel on 
confere des valeurs determinees a N, M et au pas de quantifica- 
tion Q 

3. Procede selon la revendication 2, caracterise en ce 
que le codage d'essai est realise en boucle ouverte. 

20 4. Procede selon la revendication 2 ou 3, caracterise 

en ce que, pour caracteriser les images sources, on determine un 
parametre (Pcost) caracterisant les images P obtenues lors du 
codage d'essai et un parametre (Bcost} caracterisant les images 
B obtenues lors du codage d'essai. 

2 5 5. Procede selon la revendication 4, caracterise en ce 

que le nombre N est determine a partir du parametre caracte- 
risant au moins une image P, et en ce que le nombre M esc deter- 
mine en fonction du parametre caracterisant au moins une image 
S3. 

30 6. Procede selon la revendication 4 ou 5, caracterise 

en ce que les parametres (Pcost, Bcost) caracterisant les images 
P et B sont les couts de codage de ces images P et B, par 

exemple les couts moyens . 
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7. Precede selon les revendicat ions 5 et 6, caract£- 
rise en ce que, lorsque le coGt de codage moyen (Bcost) de cha- 
que image B est, au cours du codage d'essai, super ieur au coQt 
de codage moyen (Pcost) de chaque image P, on confere la valeur 
5 l au nombre M, le groupe ne comprenant ainsi pas d' image B. 

6. Procede selon la revendicat ion 6 ou 7, caracterise 
en ce qu'au cours du codage d'essai, on determine, au fur et a 
mesure de l'arrivee des images sources, le coQt de codage pour 
chaque image B et le nombre M correspondant . 
10 9. Procede selon la revendicat ion 8, caracterise en ce 

que, lorsque les nombres M determines avant la fin du codage 
d'essai sont egaux a 1 pour une fraction importante du groupe, 
on confere la valeur 1 au nombre M pour le groupe. 

10. Procede selon la revendicat ion 8 ou 9, caracterise 
15 en ce que, lorsque les nombres M determines avant la fin du 
codage d'essai sont egaux a 1 pour au moins une fraction deter- 
mines du groupe, et lorsque le nombre M est egal a 1 pour le 
groupe precedent, on confere la valeur 1 au nombre M pour le 
groupe. 

20 11, Procede selon l'une quelconque des revendicat ions 

precedentes, caracterise en ce qu'en cas de changement de scene 
intervenant dans un groupe, la sc£ne nouvelle constitue 1' image 
I d'un groupe nouveau, le groupe alter e etant raccourci pour 
s'arreter avant cette scene nouvelle si le changement de sc£ne 

2 5 intervient, dans le groupe altere, a une distance du debut au 
moins egale au nombre minimum admissible pour N r le debut du 
groupe altere etant utilise pour allonger le groupe qui le pre- 
cede lorsque la somme du nombre d' images precedant le changement 
de scene dans le groupe altere , et du nombre d 1 images du groupe 

3C qui le precede ne depasse pas le maximum admissible pour N. 

12. Procede selon l'une quelconque des revendicat ions 1 
a 9, caracterise en ce qu'en cas de changement de scene inter- 
venant dans un groupe, la scene nouvelle constitue 1 ' image I 
d'un groupe nouveau, le groupe altere et le groupe qui le pre- 
cede etant rearranges de facon que chacun presents une longueur 
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proche de la moyenne de la longueur du groupe apres alteration 
et du groupe qui le precede. 

13. Procede selon la revendication 6, caracterise" en ce 
que le codage d'essai etant effectue selon une norme de type 
MPEG a 50 Hertz, avec N = 12, M = 3 et Q = 5, les nombres N et M 
sont fonction respectivement des coOts tnoyens de codage des 
images B et P selon les relations suivantes : 

{1) N = INT ( 389000 -Pcost l + avec l2 s N s 3 
10000 J 



NTj — 



(2) H = IH r 79000 - Boost ^ 
1 20000 J 



INT signifiant partie entiere. 

14. Procecie selon la revendication 13, caract§ris§ en 
ce que 1 £ M £ 5. 

15. Procede selon la revendication 13 ou 14, caractS- 
rise" en ce que, lorsque le cout de codage (Bcost) est sup6rieur 
a 179000, le nombre M est determine par la relation suivante : 



(3) M = 5 JNT1 P C0S t - 1 1 , avec 1 < M < 7 . 
Lb cost J 

16. Procede selon l'une quelconque des revendi cat ions 1 
a 6, caracterise 1 en ce qu'on fait varier le nombre M a l'in- 
terieur d'un groupe. 

17. Procede selon l'une quelconque des revendi cat ions 2 
a 6, caracterise" en ce que la compression est effectuee apres le 
codage d'essai . 

18. Procede selon l'une quelconque des revendications 4 
a 6, caracterise en ce que la compression debute apres determi- 
nation du parametre caracterisant la premiere image B ou la pre- 
miere image P. 

19. Procede selon la revendication 18, caracterise en 
ce qje la formation d'un groupe code est interrompue quand son 
nombre d 1 images codees est: au moins egal au nombre N determine a 
partir de 1 1 image P courante . 

20. Dispositif de codage pour la mise en oeuvre du pro- 
cede selon la revendication 4, 5 ou 6, caracterise en ce qu'il 
comporte un canal pour effectuer le codage d'essai et determiner 
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20 

les parametres H et N et un canal de codage (78, 74) recevanc 
les informations du premier canal pour ef fectuer le codage pro- 
prement dit. 




FIG.3 



2783388 

2/2 



r cost(i) K costli) 




FIG. 6 FIG. 7 





P cost(i) 




CODEUR 




MPEG; 


B eosUj} 









N(j),M(j) 



ML 







MPEG 2 









FIG .8 



REPUBLIQUE FRANCAfSE 



1NSTITUT NATIONAL 
de la 

PROPR1ETE INDUSTRIELLE 



RAPPORT DE RECHERCHE 
PRELIMINAIRE 



2783388 



FA 562967 
FR 9811495 



DOCUMENTS CONSIDERES COMME PERTINENTS 



des parties perlln antes 



i- r-dicatii n en cas de besoirt, 



EP 0 705 041 A (SONY CORP) 3 avrll 1996 

* page 6, ligne 15 - ligne 44 * 

* page 7, ligne 1 - page 10, ligne 8 * 

* abrege; figures 6,7 * 



FAN J ET AL: "ADAPTIVE IMAGE SEQUENCE 

CODING BASED ON GLOBAL AND LOCAL 

COMPENSABILITY ANALYSIS" 

OPTICAL ENGINEERING, 

vol. 35, no. 10, 1 octobre 1996, pages 

2838-2843, XP000634361 

* page 2838, colonne de drolte, ligne 1 - 
Hgne 10 * 

* section 2 "Classification of scene 
complexity" * 

* Introduction, sous-sections 3.1 et 3.2 
de la section 3 "Reference frame position 
algorithm" * 

* abrege; figure 1 * 

EP 0 737 014 A (SONY CORP) 9 octobre 1996 

* colonne 5, ligne 35 - colonne 6. ligne 
20 * 

* abrege; figure 3 * 

LEE 0 ET AL: "RATE-DISTORTION OPTIMIZED 
FRAME TYPE SELECTION FOR MPEG ENCODING" 
IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS 
FOR VIDEO TECHNOLOGY, 

vol. 7, no. 3, 1 juin 1997, pages 501-510, 
XP000690588 

* section II "Problem formulation" * 

* section IV "Reference frame positioning" 
* 

* abrege * 



1-3,11 

12,16,17 

4,20 

5-10, 
13-15, 
18,19 



3 juin 1999 



La, V 



GATE GORE DES DOCUMENTS CITES 

K : partlajllSrsmarvt pertinent a y seul 

( ; partloilierement pertinent en comDlnalaon avecun 

autre document cie la mama categore 
\ ; pertinent a. rencontre Jau molns une revencScation 

ou si riera-pl an technologies general 



T : theorie oil prlncipe a la base da rinrenHon 

E : document da brevet baneficiant d'une date anteneure 

b la data de deplt el qui n'a ate publiequ'a cette date 

de depot ou qua une dale pcsterieure. 
D : cite dans [adernande 
L : o!6 pour dT adtres ralsons 

5 mambt 1 l» ihb milk Bumsn r dant 



page 1 de 2 



REPUBLIQUE FRANCAISE 



INSTITUT NATIONAL 
de la 

PROPRIETE INDUSTRIELLE 



RAPPORT DE RECHERCHE 
PRELIMINAIRE 



2783388 



DOCUMENTS CONSfDERES COM ME PERTINENTS 



US 5 694 171 A (KATTO JIRO) 
2 decembre 1997 

* colonne 5, Hgne 39 - colonne 7, Hgne 
17 * 

* abrege; figures 1,6 * 

LEE J ET AL: "TEMPORALLY ADAPTIVE MOTION 
INTERPOLATION EXPLOITING TEMPORAL MASKING 
IN VISUAL PERCEPTION" 
IEEE TRANSACTIONS ON IMAGE PROCESSING, 
vol. 3, no. 5, 1 septembre 1994, pages 
513-526, XP000476828 

* abrege * 

EP 0 597 647 A {SONY CORP) 18 mal 1994 

* revendlcatlons 1,5; figure 1 * 

EP 0 762 778 A (SONY CORP) 12 mars 1997 

* abrege; figure 5 * 



1-20 
1,11,12 



Dst« ij acltfirsment do In ractwrcf 

3 Juln 1999 



CATEGORIC DES DOCUMENTS CITES 

V particulierernenl pertinent a lul seul 

Y : particulleremenl pertinent en comblnalson avec un 

ai/Ire documenl de la meme categorie 
A : pertinenrt a rencontre d'au molri3 una rwendlcation 

oti arriere-plan technotoglque general 
Oidivulgalion non-6crile 



T : theorfa ou prlncIpe a la base de 1'invsntion 

E : document de brwat banaficianl tfune date antarieure 

a la date de depot el qui n'a ete publiequ'a =ette date 

de depdl ou qu'a una date poslerieura. 
D : trie dans la demarde 
L : cite pour tfautras raisons 

& ■ membra de la meme famiTle, document correspondent 



page 2 de 2 



02 - BR 9904108 
04 - CN 1 248864 
07 - EP 987903 
10 - FR 2783388 
15 -JP 2000102021 
20 -KR 2000023133 
27 -ZA 9905802 



The method involves coding images according to groups each of which comprises N 
images, with an I image coded in intra mode, P images predicted as a function of the intra image 
I or of the preceding P image. Each P image is preceded and followed by n bidirectionally 
predicted B images, n possibly being zero. The number M = n+ 1 represents the structure of the 
group. 

At least one parameter characterising the source images which are to be coded according to a 
group is determined using a test coding (70). The numbers N and M are made to depend on this 
parameter. In the course of the test coding, defined values are conferred onN, M and on the 
quantisation interval Q. 



